大模型开启AI新时代

Original 胡媛通信产业网 2023-10-19

大模型的发展是大势所趋，大模型未来将会助推数字经济，为智能化升级带来新范式。

随着ChatGPT“狂飙”，一个大模型的时代正在来临，加速千亿甚至万亿参数的大模型陆续出现。

毋庸置疑，“东数西算”、高性能计算、数据分析、数据挖掘的快速发展，开启通用认知大模型时代。目前，大规模的生态已初具规模。

IDC预测，未来大模型将带动新的产业和服务应用范式，在深度学习平台的支撑下将成为产业智能化基座，企业需加快建设人工智能统一底座，融合专家知识图谱，打造可面向跨场景或行业服务的“元能力引擎”。

大模型有多“大”

ChatGPT是在GPT基础上进一步开发的自然语言处理模型。GPT模型是一种自然语言处理（NLP）模型，使用多层变换器（Transformer）来预测下一个单词的概率分布，通过训练在大型文本语料库上学习到语言模式来生成自然语言文本。从GPT-1到GPT-4智能化程度不断提升。

第一代GPT-1诞生于2018年6月，训练参数量达1.17亿个，数据库规模为5GB；第二代GPT-2诞生于2019年2月，训练参数量为15亿个，数据库规模为40GB；第三代GPT-3诞生于2020年5月，训练参数量飞跃至1750亿个，数据库规模达到45TB；第四代GPT-4诞生于2023年3月，GPT-4比以往任何时候都更具创造性和协作性，可以更准确地解决难题，可为ChatGPT和新Bing等应用程序提供支持。

随着大模型的潮流挺进，也必然促进中国AI “新赛道”的加速构建。

从技术的角度来看，大模型发端于自然语言处理领域，以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用干训练的数据量级也显著提升，带来了模型能力的提高。此外，继语言模态之后,如视觉大模型等其他模态的大模型研究,也开始逐步受到重视。进一步地，单模态的大模型被统一整合起来,模拟人脑多模态感知的大模型出现，推动了AI从感知到认知的发展。

具体来看，首先，大模型具有良好的通用性、泛化性，显著降低人工智能应用门槛；其次，深度学习平台为预训练大模型的发展保驾护航，两者结合夯实了产业智能化基座；再次，大模型在推进产业智能化升级中已表现出巨大潜力，企业应该尽早关注；最后，未来还需加强大模型与真实场景需求匹配，推动大模型大规模落地。

高手的较量

ChatGPT的出现，预示着生成式AI的发展迎来重要转折。

随着数字经济、元宇宙等概念的逐渐兴起,人工智能进入大规模落地应用的关键时期，但其开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题开始显露，阻碍了规模化落地。AI大模型凭借其优越的泛化性、通用性、迁移性，为人工智能大规模落地带来新的希望。

相关机构预测，生成式AI将产生数万亿美元经济价值。其中，中国市场应用亦有望突破千亿规模，并于2025年翻倍突破2000亿元。

当前，国内大模型底层服务支撑基本完善,各厂商围绕核心算法与模型库、上层软件平台深入布局优化。百度、阿里巴巴、商汤、华为等人工智能企业，智源研究院、中科院自动化所等研究机构，英伟达等芯片厂商也纷纷入局。

百度“文心一言”（ERNIE Bot）在2023年3月完成内测，面向公众开放；腾讯混元AI大模型团队推出了万亿级别中文NLP预训练模型HunYuan-NLP-1T，该模型已落地于相关内部产品并服务外部客户；京东云言犀将推出产业版ChatJD，并公布落地应用“125”计划；科大讯飞类ChatGPT技术2023年5月将率先落地AI学习机产品……

趋势已然，大模型技术突破代表了人工智能发展的一个重要里程碑，将会带来一场人工智能和通用人工智能为驱动力的“工业革命”，中国在该领域内必然不会缺席。随着大模型的潮流挺进，也必然促进中国AI “新赛道”的加速构建。

大模型增强了AI技术的通用性，让开发者以更低成本、更低门槛,面向场景研发更好的AI模型，助力普惠AI的实现。但目前，基础大模型距离大规模产业应用并成为产业基座还有很长的一段路要走,不仅需要有与场景深度融合的大模型体系，也需要有支持全流程应用落地的专业工具和平台，还需要开放的生态来激发创新。只有“模型+工具平台+生态”三层之间交互赋能,才能形成良性循环的产业智能化生态共同体。

与此同时，通信业如何拥抱大模型？在廉士国看来，ChatGPT等大模型的运行和服务离不开算力和网络支撑，运营商作为新型信息基础设施服务运营者，可以加强算网融合的智能算力中心建设，来承载ChatGPT等大模型训练和推理服务，真正让大模型服务遍及无处不在的用户。

大模型的商业之惑

随着人工智能赋能实体经济进入深水区，企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一，可极大降低企业的技术门槛和开发成本。

开放、开源是技术逐渐成熟和规模化输出的象征，随着大模型的落地，头部企业将开放技术，赋能中小企业，打造以大模型为底座的生态。目前，大模型的开放、开源还主要在算法、API服务、开发工具的使用上，未来需要打造标准算法集、大模型平台、大模型数据集等全栈化的开放生态，将大模型的红利释放给每个开发者，并促进大模型创新应用的出现。

ChatGPT代表着人类语言可以作为计算机语言来使用/编程，这将大幅提升生成式AI应用的效率、拓宽适用场景、大幅度提升和创造生产力，并打开广阔的市场想象空间。

类ChatGPT的优势很多，但也有很多前置条件，包括核心算法、训练数据、行业案例等多种因素。同时，一方面，中文大语言模型的数据集更为稀缺；另一方面，垂直细分领域的数据集获得难度很大。因此，这个赛道天生自带较高门槛，必定只有少数竞争者才能胜出。

《2022中国大模型发展白皮书》建议，对于行业用户，第一，各行业技术买家都应该尽早拥抱大模型；第二，在合作方面，主要关注大模型与自身业务的适配性；第三，应与头部厂商联手打造行业标杆。

对于大模型供应商来说，在技术方面，需要持续探究大模型的生成可控性。在安全性方面，大模型的技术安全，以及伴随着大模型落地所带来的伦理问题仍是关注重点。在商业化方面，大模型的路径仍不明确，海外市场发展较早，国内厂商可以重点借鉴。

毫无疑问，大模型的发展是大势所趋，大模型将助推数字经济，为智能化升级带来新范式。

采写：胡媛

图表：张曙念胡媛

编辑、校对：胡媛

指导：新文

延伸阅读：

谁会领跑中国大模型？

AI向善之惑：要不要给大模型装上“红绿灯”？